#физическое рассуждение31.05.2025
Бенчмарк PHYX выявляет пробелы в физическом рассуждении мультимодальных моделей ИИ
Бенчмарк PHYX выявляет ключевые слабые места в способности современных мультимодальных моделей ИИ выполнять физическое рассуждение, подчеркивая сложность интеграции визуальных данных с символическими и причинными знаниями.